WO 2004/044889 



1U/534764 
JC06 Rec'd PCT/PTO 12 MAY 2005 

^fcCT/EP2003/0 1 2660 



Spracheinqabe- Interface 



Die Erfindung betrifft Systeme, bei denen das Sprechen eines 
Anwenders aufgenommen und als Signal weitergeleitet wird. 
Insbesondere betrifft die Erfindung Systeme, bei denen uber 
eine Spracheingabe Funktionen ausgelost oder gesteuert wer- 
den . . 

Systeme mit Spracheingabe und Sprachsteuerung sind bekannt . 
So sind beispielsweise bei Computern Eingaben - Diktieren von 
Texten oder Steuerbef ehle - per Sprache moglich. In der Medi- 
zintechnik exist ieren Gerate, die zur Entlastung bei schwie- 
rigen Eingriffen durch Sprachkommandos des Arztes gesteuert 
werden konnen. Auch im Sicherheitsbereich werden Vorrichtun- 
gen eingesetzt, die beispielsweise eine verschlossene Tur se- 
lektiv nur auf Spracheingaben autorisierter Personen offnen. 

Alle derartigen System erfordern fur das Erkennen der sprach- 
lichen Information bzw. Kommandos eine hohe akustische Quali- 
tat der Spracheingabe. Besonders storend wirkt sich bei- 
spielsweise ein zu groSer Abstand zwischen M.ikrofon und Mund 
des Sprechers aus (zu geringe Eingabelautstarke) . In gleicher 
Weise wirkt ein Sprechen in eine Richtung, die nicht im 
Hauptaufnahmebereich des Mikrofons liegt. Auch eine relativ 
nahe Distanz zum Mikrofon kann sich negativ auswirken, da in 
diesem Fall zum einen leicht eine Ubersteuerung des Aufnahme- 
pegels auftreten kann, zum anderen durch den Atmen des Spre- 
chers zusatzlich starke akustische Storgerausche (Windgerau- 
sche) entstehen konnen. Grundsatzlich wirkt sich auch ein ho- 
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her Gerauschpegel aus der Umgebung sehr storend auf die Er- 
kennungsgenauigkeit des Spracheingabesystems 



aus 



Urn diese bekannten Probleme zu losen, werden beispielsweise 
5 fur Computersysteme mit Texteingabe Mikrof onbugel eingesetzt, 
die (zumeist in Verbindung mit einem Kopfhorer oder Ohrhorer) 
vom Anwender am Kopf getragen werden. Bei entsprechender Aus- 
richtung des Bugels befindet sich das Auf nahmemikrof on auch 
bei Kopfbewegungen stets in gleichem Abstand nahe am Mund des 

10 Sprechers. Nachteilig ist dabei die eingeschrankte Bewegungs- 
freiheit aufgrund der iiblichen Kabel verbindung zum Computer. 
Auch konnen Storgerausche durch Bewegungen des Kabels auftre- 
ten. Zudem empfinden viele Personen das Tragen von Kopf- oder 
Ohrhorern, insbesondere bei langerer Anwendung, als unange- 

15 nehm. 

Alternativ werden daher auch Mikrofone mit stationarer Posi- 
tion, z.B. Tischmikrofon mit Stativ oder integriert in das 
Gehause (PC, Laptop) oder befestigt am Gerat (Turrahmen bei 

20 Sicherungsfunktion) verwendet . Nachteilig ist dabei die auf 
einen bestimmten Raumbereich vor dem Mikrofon beschrankte 
Aufnahmezone. Dies erfordert vom Anwender die Einhaltung ei- 
ner definierte Position w Korperhaltung, Sprechrichtung usw. , 
d.h. es besteht praktisch keine Bewegungsf reiheit wahrend der 

25 Spracheingabe . 

Ausgehend von diesem Stand der Technik liegt der vorliegenden 
Erfindung die Aufgabe zugrunde, ein verbessertes System zur 
Spracheingabe zu entwickeln, das die genannten Nachteile 
30 weitgehend uberwindet und zusatzliche Vorteile aufweist. 

Diese Aufgabe wird bei einer Vorrichtung mit den Merkmalen 
des Oberbegriffs des Anspruchs 1 gelost durch die kennzeich- 
nenden Merkmale des Anspruchs 1. Weitere Einzelheiten der Er- 
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findung und Vorzuge verschiedener Ausf uhrungsf ormen sind Ge- 
genstand der Merkmale der Unteranspruche . 



Die erf indungsgemafie Vorrichtung wird im folgenden anhand ei- 
5 ner bevorzugten Ausf uhrungsf orra beschrieben, wobei Bezug ge- 
nommen wird auf die Abbildungen und den darin aufgefiihrten 
Bezugsziffern . 



10 



Dabei zeigen: 



Fig. 1 das erf indungsgemafie Spracheingabesystem aus 
Zentraleinheit und separaten Sprachinterf ace 



Fig. 2 eine schematische Darstellung einer Ausf uhrungsf orm 
15 des Sprachinterf aces 

Fig. 3 Richtcharakteristik des vom Anwender mitgefuhrten 
Sprachinterf aces 

2 0 Die vorliegende Erfindung zielt darauf ab, Komfort und Quali- 

tat bei Spracheingabesystemen deutlich zu verbessern. Dabei 
soli ein mit Mikrofonen ausgestattetes transportables Sprach- 
interf ace vom Anwender standig getragen werden, wodurch ihm 
letztlich ein universeller Sprachzugang zu verschiedenen Sys- 
25 temen ermoglicht wird. Durch Verwendung von Mikrof onarrays 

kann auch bei verschiedenen akustischen Umgebungen eine hohe 
Eingabequalitat gegenuber Storgerauschen erreicht werden. Da- 
mit ist es auch als Spracheingabesystem in Fahrzeugen geeig- 
net, da Storungen durch Fahrgerausche oder Echoeffekte bei 

3 0 Lautsprecherausgaben vom Mikrof onarray vermindert werden. Fur 

ein standig zu tragenden Sprachinterf aces ist es wichtig, 
dass es klein und leicht ist und - je nach aufierer Gestaltung 
- beispielsweise als Schmuck oder Identif ikationssymbol ak- 
zeptiert wird. 
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Fig- 1 zeigt als Ubersicht die zusattvmenwirkenden Komponenten 
des Spracheingabesystems. Das Sprachinterf ace (2) ist als mo- 
bile Einheit ausgefuhrt und wird votn Anwender, z.B. an der 
Kleidung, getragen. Es iibertragt die akustisch aufgenommenen 
Sprachsignale drahtlos, z.B. per Infrarot- oder Funkverbin- 
dung an die Zentraleinheit (1), in der die Signale weiter 
aufbereitet werden und diverse Steuerf unktionen ausgelost 
werden . 

Zur Gewahrleistung einer hohen Qualitat der Sprachauf nahme 
wei st das Sprachinterf ace (2) zwei oder mehrere Mikrofone 
(3a, 3b, 3c) auf. Eine solche Anordnung ist in Fig. 2 vergro- 
Sert dargestellt. 

Die verwendeten Mikrofone (3a, 3b, 3c) konnen individuelle 
Richtcharakteristiken (Niere, Hypemiere, Acht) aufweisen. 
Damit wird bereits durch eine vordef inierte Mikrof on-Richt- 
charakteristik Schall vorrangig aus einer bestimmten Zone 
verstarkt auf genommen . 

Die hier erf indungsgemaS vorgeschlagene Verwendung eines 
kleinen Mikrof onsystems mit zwei oder mehr Mikrofonen erlaubt 
die Bildung von Mikrof onarrays . Durch das Zusattunenwirken der 
Mikrofone in einem solchen Mikrof onarray kann - in Verbindung 
mit einer fur solche Arrays ublichen elektronischen Aufberei- 
tung - die Qualitat der Spracheingabe wesentlich verbessert 
werden: So kann - uber die oben erwahnte, unveranderliche 
Mikrofon-Richtcharakteristik hinaus - eine spezielle raumli- 
che Richtwirkung des Mikrof onarrays eingestellt werden, d.h. 
akustische Signale werden vorrangig aus einem gewiinschten 
Raumbereich (Mundpartie des Anwenders) auf genommen . Durch 
diese zusatzliche Array-Richtcharakteristik werden Nebenge- 
rausche aus anderen Bereichen der Umgebung weiter unterdruckt 
bzw. konnen elektronisch weitgehend herausgef iltert werden. 
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Die Array-Richtcharakteristik ergibt sich aus der Anzahl und 
geometrischer Anordnung der Mikrofone. Im einfachsten Fall 
werden zwei Mikrofone verwendet (Minimalkonf iguration) . Vor- 
5 zugsweise ist das Interface jedoch mit drei (wie in Fig. 2 

dargestellt) oder mehr Mikrofonen ausgestattet, die eine bes- 
sere Richtwirkung und Storschallunterdruckung ermoglichen. Es 
gibt zwei grundsatzliche Mikrof on - Array - Anor dnungen : ^broad- 
side" und "end-fire". Bei "broad-side" liegt die Richtwirkung 

10 senkrecht auf der gedachten Verbindungslinie der Mikrofone, 

bei "end-fire" liegt die Richtwirkung in Richtung der gedach- 
ten Verbindungslinie der Mikrofone. Das Ausgangssignal eines 
"broad- side" Arrays ergibt sich in einfachster Form aus der 
Summation der einzelnen Signale, beim "end-fire" Array aus 

15 der Differenz, wobei auch Lauf zeitkorrekturen eingesetzt wer- 
den. 

Die Richtwirkung des Mikrof onarrays kann durch weitere MaS- 
nahmen verandert und damit eine adaptive Richtcharakterist ik 

2 0 erreicht werden. Dabei werden die einzelnen Mikrof onsignale 

nicht einfach addiert oder subtrahiert, sondern durch spe- 
zielle Signalverarbeitungsalgorithmen so ausgewertet, dass 
akustische Signale aus einer Hauptrichtung verstarkt empfan- 
gen werden und Nebengerausche aus anderen Richtungen abge- 
25 schwacht aufgenommen werden. Die Lage der Hauptrichtung ist 
dabei veranderbar, d.h. sie kann adaptiv an ein sich andern- 
des akustisches Szenario angepaSt werden. Dabei kann bei- 
spielsweise die Art und Weise, wie das Signal der Hauptrich- 
tung bewertet und maximiert wird und gleichzeitig Storgerau- 

3 0 sche aus Nebenrichtungen minimiert werden, in einem Fehler- 

kriterium festgelegt sein. Algorithmen zur Erzeugung einer 
adaptiven Richtwirkung sind unter dem Begriff "Beamf orming" 
bekannt . Verbreitete Algorithmen sind z.B. der Jim-Griffith 
Beamf ormer oder der "Frost" Beamf ormer. 
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Durch veranderung entsprechender Parameter kann die Haupt- 
richtung beim ^Beamf orming^ so variiert werden, dass sie mit 
der Richtung aus der gesprochen wird ubereinstimmt , was einer 
aktiven Sprecherortung entspricht . Eine einfache Moglichkeit 
5 die Sprechrichtung zu bestimmen ist z.B. die Lauf zeitschat- 
zung zwischen zwei Empf angssignalen zweier Mikrofone. Wird 
die Kreuzkorrelation zwischen den beiden Werten errechnet, so 
ergibt sich der maximale Kreuzkorrel at ions -Wert bei der Lauf- 
zeitverschiebung beider Signale. Wird nun die diese Laufzeit 
10 zur Verzogerung des einen Signals eingesetzt, so sind die 

beiden Signale wieder gleichphasig . Damit ist die Hauptrich- 
tung in die aktuelle Sprechrichtung eingestellt . Wird die 
Laufzeitschatzung und Korrektur wiederholt durchgef uhrt , so 
wird einer Relativbewegung des Sprechers adaptiv gef olgt . Da- 
15 bei ist es vorteilhaft fur die Sprecherortung nur einen zuvor 
festgelegten Raumsektor zuzulassen. Dazu ist es erf orderlich, 
die Mikrofonanordnung grob in einer gewissen Richtung zum 
Mund des Sprechers anzubringen, z.B. am Kleidungsstuck des 
Sprechers . 

20 

Der Mund des Anwenders kann sich dann innerhalb des festge- 
legten Raumsektors gegenuber der Position des Sprachinter- 
faces (2) frei bewegen, die Sprecherortung wird ihm folgen. 
Wird eine Signalquelle auSerhalb des festgelegten Raumsektors 
25 detektiert, dann wird diese als Storung identif iziert (bei- 
spielsweise eine Lautsprecherausgabe) . Der Beamf orming-Algo- 
rithmus kann sich nun speziell auf den Schall aus dieser 
Richtung im Sinne eine Minimierung des Storsignals einstel- 
len. Dies lafit auch eine wirksame Echokompensation zu. 

Fig. 3 zeigt beispielhaft ein kleines Mikrof onsystem aus zwei 
einzelnen Mikrofonen mit einer eingepragten Richtcharakteris- 
tik die rechts am Mund des Sprechers vorbei gerichtet ist. 
Die Mikrofone sind hier an der oberen Kante eines kleinen Ge- 
35 hauses angebracht . Der Array-Typ ist ^broad-side^ , d.h. die 
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Richtwirkung des Arrays ist senkrecht zur Kante des Gehauses 
nach oben gerichtet . Die adaptive Richtwirkung uber Beamfor- 
ming-Algorithmen sorgt dafur, dass die wirksame Richtcharak- 
teristik auf die Quelle, den Mund des Anwenders ausgerichtet 
ist . 

Mikrofone mit hoher Qualitat sind als Miniaturausf uhrung (bis 
herab zu Mil lime tergrofie) verfiigbar. Ebenso sind drahtlose 
Ubertragungseinrichtungen, z.B. Infrarot- oder Funksender, 
mit heutiger Technik (z.B. als SMD oder IC) extrem klein her- 
stellbar. Zur Stromversorgung genugt eine kleine Batterie 
bzw. Akkumulator (z.B. Knopf zelle) , da nur ein geringer Ener- 
gieverbrauch entsteht. Damit ist die Integration aller Kompo- 
nenten des Sprachinterf aces (2) zu einer kleinen und auch 
aufgrund des sehr geringen Gewichts bequem tragbaren Einheit 
moglich. Beispielsweise kann ein solches miniaturisiertes 
Sprachinterf ace (2) als Ansteckvorrichtung bzw. Clip an der 
Kleidung befestigt werden (vergleichbar mit einer Brosche) 
oder an einem Armband oder einer Halskette mitgefuhrt werden. 

In einer ersten Ausf uhrungsf orm werden die jeweiligen Signale 
der einzelnen Mikrofone des Arrays parallel zur Zentralein- 
heit ubermittelt. Dort werden dann diese Signale elektronisch 
weiter verarbeitet, um Richtungscharakteristik und Storge- 
rauschunterdruckung einzustellen . Diese Funktionen konnen al- 
ternativ - zumindest teilweise - auch bereits im Sprachinter- 
face selbst erfolgen. In dem Sprachinterf ace (2) sind dann 
entsprechende elektronische Schaltkreise integriert, die fur 
eine erste Signalauf bereitung sorgen. So kann beispielsweise 
auch der jeweilige Mikrof on-Auf nahmepegel durch automat ische 
Verstarkungsregelungen (Automatic -Gain- Control) angepaSt wer- 
den oder durch entsprechende Filter bestimmte Frequenzanteile 
abgeschwacht oder verstarkt werden. 
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Wie in Figur 2 dargestellt kann das Eingabeinterf ace (2) auch 
Komponenten fur eine Umwandlung analoger in digitale Signale 
aufweisen. Die Ubertragung digitaler Signale zur Zentralem- 
heit (1) bietet mit den heute verfiigbaren Sende/Empf angs- 
techniken einen sehr hohen Inf ormationsf luss bei minimaler 
Storanf alligkeit . 

Das Sprachinterface (2) kann mit einer Aktivierungstaste oder 
Sensorflache ausgestattet werden, deren Betatigung/Beruhrung 
eine Spracherkennung aktiviert, beispielsweise durch Ubertra- 
gung eines entsprechenden Signals an die Zentraleinheit (1) . 
Alternativ kann eine solche Aktivierung auch durch Sprachein- 
gabe eines Schlusselwortes erfolgen. 

in einer erweiterten Ausf uhrungsf orm weist das Sprachinter- 
face (2) zusatzlich eine Empf angseinrichtung auf (nicht dar- 
gestellt) , die drahtlos ubermittelte Steuersignale von der 
Zentraleinheit (1) empfangen kann. Damit kann die Charakte- 
ristik der Sprachauf nahme (Kombination der Mikrofone zum Ar- 
ray, Verstarkung, Frequenzfilter usw.) im Sprachinterface (2) 
durch die Zentraleinheit (1) verandert werden. Weiterhin kann 
die Zentraleinheit (1) uber die Empf angseinrichtung dem Be- 
nutzer auch ein akustisches oder optisches Signal ubermit- 
teln, beispielsweise als " Feedback \ fur erfolgreich ausgelos- 
te Aktionen aber auch Fehlf unktionen (Kommando nicht erkannt 
oder - z.B. wegen Storung der Schnittstellen - nicht ausfuhr- 
bare Funktion) oder zur Anforderung weiterer Eingaben (Kom- 
mando unvollstandig) . Als Signalgeber konnen z.B. verschie- 
denfarbige LED's oder piezokeramische Kleinlautsprecher in 
das spracheingabeinterface (2) integriert werden. Auch ist es 
denkbar, eine Eingabeeinheit , beispielsweise Tastatur, zur 
Eingabe von Inf ormationen in Textform vorzusehen. 

Die Zentraleinheit (1) empfangt die drahtlos ubermittelten 
35 Signale des Sprachinterf aces (2) und wertet sie fur eine 
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Spracherkennung aus . Auch die verschiedenen erf orderlichen 
Kalkulationen zur Sprecherortung und adaptiven Anpassung der 
Richtungscharakteristik des Mikrof onarrays konnen ganz oder 
teilweise in der Zentraleinheit (1) erfolgen. Die fur eine 
5 zuverlassige und schnelle Signalverarbeitung und Spracherken- 
nung erf orderliche Prozessorleistung kann beispielsweise uber 
ein ubliches Computer- bzw. Mikroprozessorsystem zur Verfu- 
gung gestellt werden, das vorzugsweise Teil der Zentralein- 
heit (1) ist. Damit konnen anwenderspezif ische Konf iguratio- 
10 nen (Arraycharakteristik, Spracheigenheiten, spezielle 

Schalt/Steuerkommandos usw.) jederzeit neu einprogrammiert 
werden . 

Da die Zentraleinheit (1) getrennt vom Sprachinterf ace (2) - 
15 z.B. integriert in Gerate (TV, Telef onanlage, PC-System usw.) 
- stationar ausgebildet ist, entstehen auch bei leistungsfa- 
higer elektronischer und EDV- technischer Ausstattung keine 
besonderen Probleme oder Einschrankungen bzgl . Stromversor- 
gung, Volumen, Gewicht oder auch Kuhlung warmeproduzierender 
2 0 Komponenten (Prozessor) . 



Die Zentraleinheit (1) ist so konf iguriert , dass erkannte 
Kommandos uber integrierte Schnittstellen (4a, 4b, 4c) ent- 
sprechende Schalt- und Steuerf unktionen auslosen, auf die 

2 5 verschiedene externe Gerate reagieren. 

Hierzu konnen beispielsweise Telef onsysteme, Audio- und Vi- 
deogerate gehoren, aber auch eine Vielzahl elektrisch/elek- 
tronisch steuerbarer Hausgerate (Licht, Heizung, Klimaanlage, 

3 0 Jalousien, Turoffner u.v.a.m) . Bei Einsatz in einem Fahrzeug 

konnen entsprechend Funktionen des Fahrzeugs (Navigations sys- 
tem, Musikanlage, Klima, Scheinwerf er, Scheibenwischer usw.) 
gesteuert werden. 
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Die Ubertragung der Steuersignale der Schnittstellen (4a, 4b, 
4c) zu den verschiedenen externen Geraten kann ihrerseits 
wieder drahtlos (IR. Funk) oder auch (z.B. bei Einsatz im 
Fahrzeug) mitt els Kabelverbindung erfolgen. 

Die erf indungsgemaSe Spracheingabevorrichtung bietet dem An- 
wender vollige Bewegungsfreiheit (auch uber grofcere Distanz 
z B verschiedene Raume/Etagen eines Hauses) . Hinzu kommt em 
optimaler Tragekomf ort , da das Sprachinterf ace (2) nicht am 
Kopf befestigt werden mufi. Durch das kleine Eigengewicht und 
die geringe Grofce (insbesondere als Miniaturausf uhrung) ent- 
steht durch das Sprachinterf ace keinerlei Behinderung, so 
dass es - vergleichbar zu einer Armbanduhr - fur ein dauer- 
haftes Tragen geeignet ist . 

Verschiedene Gerate bzw. Funktionen an unterschiedlichen Or- 
ten konnen mit ein und demselben Sprachinterf ace gesteuert 
werden (Multimediaeinrichtungen, Hausgerate, Fahrzeugf unktxo- 
nen, Bviro-PC, sicherheitsanwendungen, usw.), da auch mehrere 
Zentraleinheiten an unterschiedlichen Standorten (z.B. Pri- 
vatraume, Fahrzeug, Arbeitsbereich) so eingestellt werden 
konnen, dass sie auf das gleiche Sprachinterf ace bzw. den 
gleichen Anwender reagieren. 

Besonders vorteilhaft ist die hohe Flexibility des vorge- 
stellten Spracheingabesystems . So ermoglicht das Mikrofonar- 
ray eine aktive - je nach Ausfuhrung auch automatische - Jus- 
tierung auf veranderte Gegebenheiten, wie z.B. andere Raum- 
akustik oder Befestigung des Sprachinterf aces an anderer 
Stelle der Kleidung (andere Sprechrichtung) oder auch ein 
neuer Anwender (eigene Sprechweise) . Durch Programmierung der 
zentraleinheit kann das Spracheingabe system flexibel an die 
jeweiligen Steuer und Regelungsauf gaben angepaSt werden. 
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Grundsatzlich bietet das erf indungsgemaSe System den Vorteil, 
dass das sehr kleine und leichte Sprachinterf ace vom Anwender 
standig getragen werden kann. Ein Benutzer kann es ohne Be- 
hinderung auch bei sich fuhren, wenn er seinen Auf enthaltsort 
5 andert, z.B. in sein Auto einsteigt . Durch das Mikrof onarray 
und damit verbundenen Richtungswirkung der Schallauf nahme er- 
gibt sich auch bei ungunstigen Umstanden (Umgebungsgerausche) 
eine hohe akustische Sprachauf nahmequal it at . Die aufwandigen 
Prozesse der Sprachauf bereitung konnen uber entsprechend 

10 leistungsf ahige Komponenten in der Zentraleinheit mit sehr 

hoher Erkennungs s i cherhe i t erfolgen. Dabei kann die Spracher- 
kennung individuell auf einen oder mehrere Anwender justiert 
werden, z.B. fur eine Funkt ionsbes chrankung nur auf vorbe- 
stimmte, autorisierte Person(en). Die Ansteuerung verschiede- 

15 ner Gerate uber entsprechende Schnittstellen ist frei konfi- 
gurierbar und kann nach individuellen Wiinschen fur verschie- 
denste Anwendungszwecke modif iziert und erweitert werden. 
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Spracheingabesystem aus stationarer Zentraleinheit (1) 
und transportablem Sprachinterf ace (2), wobei 
die Zentraleinheit (1) Mittel zum Empfang drahtlos uber- 
mittelter Sprachsignale und Mittel fur eine Auswertung 
dieser Sprachsignale zur Erkennung gesprochener Worte 
aufweist, sowie Schnittstellen (4a, 4b, 4c), die in Ab- 
hangigkeit von erkannten Worten Schalt- bzw. Regelsignale 
erzeugen und an externe Cerate ubertragen und wobei 
das Sprachinterface (2) zwei oder mehr Mikrofone (3a, 3b, 
3c) aufweist, die als Mikrof onarray kombiniert sind, so- 
wie Mittel zur drahtlosen Ubertragung der vom Mikrofonar- 
ray generierten Signale an die Zentraleinheit (1) . 

Spracheingabesystem nach Anspruch 1, 
dadurch gekennzeichnet, 
dass das Sprachinterface (2) Mittel zur elektronischen 
Aufbereitung der von den Mikrofonen (3a, 3b, 3c) des Mik- 
rof onarrays erzeugten Signale aufweist. 

Spracheingabsystem nach Anspruch 2, 

dadurch gekennzeichnet, 

dass die elektronische Aufbereitung eine Veranderung der 

jeweiligen Signalpegel (Verstarkung , Dampfung, AGC) und/ 

oder Frequenzanteile (Hohen- , Tief en- , Band-Filter) und/ 

oder der jeweiligen Signalphasen bewirkt . 
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4. Spracheingabesystem nach einem der Anspruche 2 oder 3, 
dadurch gekennzeichnet, 

dass die Mittel zur elektronischen Aufbereitung auch Mit- 
5 tel zur Umwandlung analoger in digitale Signale beinhal- 

ten. 

5. Spracheingabesystem nach einem der Anspruche 1 bis 4, 
dadurch gekennzeichnet, 

10 dass das Sprachinterf ace (2) Mittel zum Empfang drahtlos 

(z.B. IR, Funk) von der Zentraleinheit (1) ubermittelter 
Signale auf weist . 

6. Spracheingabesystem nach Anspruch 2, 3 oder 4, 
15 dadurch gekennzeichnet, 

dass das Sprachinterf ace (2) Mittel zum Empfang drahtlos 
(z.B. IR, Funk) von der Zentraleinheit (1) ubermittelter 
Steuersignale auf weist, mit denen die Zentraleinheit (1) 
die Mittel zur elektronischen Aufbereitung des Sprachin- 
20 terfaces (2) beeinflussen kann. 

7. Spracheingabesystem nach einem der Anspruche 1 bis 6, 
dadurch gekennzeichnet, 

dass die Mittel der Zentraleinheit (1) zur Auswertung der 
25 Sprachsignale als Prozessorsystem (EDV) ausgefuhrt sind. 

8 . Spracheingabesystem nach Anspruch 7 , 
dadurch gekennzeichnet, 

dass das Prozessorsystem Anwender -be zogene Daten (z.B. 
30 individuelle Sprachkommandos, Sprachparameter) speichert 

und zur Auswertung der Sprachsignale und/oder zur Erzeu- 
gung individuell zugeordneter Steuersignale einbezieht . 
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9. Spracheingabesystem nach einem der Anspriiche 1 bis 8, 
dadurch gekennzeichnet, 

dass das Mikrofon-Array (3a, 3b, 3c) eine Richtcharakte- 
ristik in der Weise aufweist, dass Schall vorrangig aus 
5 einer Richtung auf genommen wird. 

10. Spracheingabesystem nach Anspruch 9, 
dadurch gekennzeichnet, 

dass die Richtcharakteristik durch Aufbereitung der von 
10 den Mikrofonen (3a, 3b, 3c) des Mikrof onarrays erzeugten 

Signale iiber Beamf orming-Algorithmen (z.B. Griffith-, 
Frost-Beamformer) verandert werden kann. 

11. Spracheingabesystem nach Anspruch 10, 

15 dadurch gekennzeichnet, 

dass die Richtcharakteristik in der Weise verandert wird, 
dass sie einer raumlichen Verlagerung der Schallquelle 
folgt (Sprechernachfuhrung) . 

20 12. Spracheingabesystem nach einem der Anspriiche 1 bis 11 
dadurch gekennzeichnet, 
dass die einzelnen Mikrofone (3a, 3b, 3c) des Arrays eine 
Richtcharakteristik (z.B. Niere, Acht) aufweisen. 
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